Logistic Regression

Machine Learning - সাইকিট-লার্ন (Scikit-Learn)

263

Logistic Regression একটি জনপ্রিয় এবং শক্তিশালী মেশিন লার্নিং অ্যালগরিদম যা সাধারণত ক্লাসিফিকেশন সমস্যাগুলির জন্য ব্যবহৃত হয়। এটি লিনিয়ার রিগ্রেশন এর মতোই কাজ করে, তবে আউটপুট একটি নির্দিষ্ট ক্লাস বা শ্রেণী (যেমন, স্প্যাম বা নন-স্প্যাম) হিসাবে থাকে, এবং এটি সাধারণত দুটি শ্রেণী বা কেটেগরি নিয়ে কাজ করে।

Logistic Regression মূলত সিগময়েড ফাংশন (sigmoid function) ব্যবহার করে, যা আউটপুটকে ০ এবং ১ এর মধ্যে সীমাবদ্ধ করে। এটি কোনো ঘটনা বা অবস্থা (যেমন, "স্প্যাম" বা "নন-স্প্যাম") হওয়ার সম্ভাবনা নির্ধারণ করে।

Logistic Regression এর মৌলিক ধারণা

Logistic Regression সাধারণত নিম্নলিখিত স্টেপে কাজ করে:

লিনিয়ার রিগ্রেশন প্রয়োগ করা:
প্রথমে এটি একটি সাধারণ লিনিয়ার রিগ্রেশন মডেল প্রয়োগ করে:
$z = b + w_1x_1 + w_2x_2 + \dots + w_nx_n$
যেখানে,
- $w_1, w_2, \dots, w_n$ হলো ফিচারগুলির জন্য ওজন (weights),
- $x_1, x_2, \dots, x_n$ হলো ইনপুট ফিচার,
- $b$ হলো বাইস (bias term)।
সিগময়েড ফাংশন প্রয়োগ করা:
লিনিয়ার আউটপুট $z$ কে সিগময়েড ফাংশনে প্রয়োগ করা হয়, যার ফলাফল $p$ , যেখানে $p$ হলো ০ এবং ১ এর মধ্যে একটি সম্ভাবনা:
$p = \frac{1}{1 + e^{-z}}$
এখানে $p$ হল সেই সম্ভাবনা যে কোনো ঘটনার ক্লাস 1 হওয়ার (যেমন "স্প্যাম") সম্ভাবনা।
ক্লাস প্রেডিকশন:
যখন $p$ ০.৫ এর বেশি হয়, তখন আউটপুট ক্লাস 1 (যেমন "স্প্যাম") হবে। অন্যথায়, আউটপুট ক্লাস 0 (যেমন "নন-স্প্যাম") হবে।

Logistic Regression মডেল ট্রেনিং

Logistic Regression এর মডেল ট্রেনিং সাধারণত সিগময়েড ফাংশন এর মাধ্যমে হয়, যেখানে আমরা লজিস্টিক ফাংশনের জন্য ব্যাকপ্রোপাগেশন বা গ্র্যাডিয়েন্ট ডেসেন্ট ব্যবহার করে লস ফাংশন (Loss Function) মিনিমাইজ করার চেষ্টা করি।

লস ফাংশন:

Logistic Regression এর জন্য লস ফাংশন হল বাইনারি ক্রস-এন্ট্রপি লস (Binary Cross-Entropy Loss)। এটি হিসাব করা হয়:

$L(y, p) = -\left(y \log(p) + (1 - y) \log(1 - p)\right)$

যেখানে:

$y$ হলো সঠিক আউটপুট (লেবেল),
$p$ হলো মডেল দ্বারা অনুমানিত সম্ভাবনা।

গ্র্যাডিয়েন্ট ডেসেন্ট ব্যবহার করে লস ফাংশনকে মিনিমাইজ করা হয়, যার মাধ্যমে মডেলটি তার ওজন সমন্বয় করে।

Logistic Regression এর উদাহরণ

নিচে একটি সাধারণ উদাহরণ দেওয়া হলো, যেখানে Scikit-Learn ব্যবহার করে Logistic Regression মডেল তৈরি করা হয়েছে।

কোড উদাহরণ:

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score

# ডেটাসেট লোড করা
iris = load_iris()
X, y = iris.data, iris.target

# শুধুমাত্র 2 ক্লাসের (যেমন, ক্লাস 0 ও 1) ডেটা ব্যবহার করা
X = X[y != 2]
y = y[y != 2]

# ডেটা ভাগ করা
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Logistic Regression মডেল তৈরি করা
model = LogisticRegression()
model.fit(X_train, y_train)

# টেস্ট সেটে প্রেডিকশন করা
y_pred = model.predict(X_test)

# মডেলের পারফরম্যান্স মূল্যায়ন করা
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

এখানে:

Iris ডেটাসেট ব্যবহার করা হয়েছে, কিন্তু শুধুমাত্র দুটি ক্লাসের ডেটা (ক্লাস 0 এবং 1) নিয়ে কাজ করা হয়েছে।
train_test_split() দিয়ে ডেটা ভাগ করা হয়েছে।
LogisticRegression() মডেল তৈরি করা হয়েছে এবং প্রশিক্ষণ দেওয়া হয়েছে।
accuracy_score() দিয়ে মডেলের একুরেসি মূল্যায়ন করা হয়েছে।

Logistic Regression এর উপকারিতা:

সহজ এবং দ্রুত:
এটি একটি সহজ মডেল, যা দ্রুত প্রশিক্ষিত এবং পরীক্ষা করা যায়।
সঠিক সিদ্ধান্ত সীমানা:
ক্লাসিফিকেশন সমস্যার জন্য এটি ভাল কাজ করে যেখানে দুটি ক্লাসের মধ্যে সীমানা নির্ধারণ করা প্রয়োজন।
প্রবণতা প্রকাশ:
Logistic Regression মডেল সম্ভাবনা বের করে, যা মডেলটির রূপ এবং শ্রেণীভুক্তির ক্ষেত্রে একটি প্রবণতা বা সিদ্ধান্তের স্তর প্রদান করে।

Logistic Regression এর সীমাবদ্ধতা:

লিনিয়ার সম্পর্ক:
এটি শুধুমাত্র লিনিয়ার সম্পর্ক (linear relationships) বুঝতে সক্ষম, তাই যখন ডেটার মধ্যে জটিল সম্পর্ক থাকে, তখন এটি সীমিত হতে পারে।
অতিরিক্ত প্রশিক্ষণ (Overfitting):
যদি মডেলটি অতিরিক্ত প্রশিক্ষিত হয়, তাহলে এটি ট্রেনিং ডেটার ওপর খুব বেশি নির্ভরশীল হয়ে পড়ে এবং নতুন ডেটায় সঠিকভাবে কাজ নাও করতে পারে।

সারাংশ

Logistic Regression একটি শক্তিশালী এবং সহজ মডেল, যা ক্লাসিফিকেশন সমস্যার জন্য ব্যবহৃত হয়। এটি সিগময়েড ফাংশন ব্যবহার করে ইনপুট ডেটাকে দুটি শ্রেণীতে বিভক্ত করে এবং মডেলটি সিদ্ধান্ত নেয় কোন শ্রেণীটি বেশি সম্ভাব্য। এটি প্রশিক্ষণ এবং মূল্যায়নের ক্ষেত্রে সহজ এবং দ্রুত হতে পারে, তবে জটিল সম্পর্কের জন্য অন্যান্য মডেল ব্যবহার করা হতে পারে।

Content added By

SATT Academy

Logistic Regression এর ভূমিকা

149

Logistic Regression একটি জনপ্রিয় মেশিন লার্নিং অ্যালগরিদম, যা প্রধানত বাইনারি ক্লাসিফিকেশন সমস্যা সমাধানে ব্যবহৃত হয়। এটি একটি লিনিয়ার মডেল হলেও, আউটপুট একটি প্রবাবিলিটি (probability) প্রদান করে, যা পরবর্তীতে দুটি শ্রেণির মধ্যে একটি নির্ধারণ করতে ব্যবহৃত হয়। এর মাধ্যমে একটি ইনপুটের জন্য দুটি সম্ভাব্য আউটপুট ক্লাসের মধ্যে কোনটি হতে পারে, তা পূর্বাভাস করা হয়।

যদিও এটি "রিগ্রেশন" নামে পরিচিত, এটি আসলে ক্লাসিফিকেশন সমস্যা সমাধান করে, যেখানে আউটপুট একটি বাইনারি (দ্বৈত) শ্রেণি হয় (যেমন: 0 বা 1, স্প্যাম বা নন-স্প্যাম, পাস বা ফেইল)।

Logistic Regression এর ভূমিকা এবং ব্যবহার

বাইনারি ক্লাসিফিকেশন সমস্যা:
Logistic Regression প্রধানত বাইনারি ক্লাসিফিকেশন সমস্যা সমাধান করতে ব্যবহৃত হয়, যেখানে আউটপুট দুটি শ্রেণির মধ্যে একটি হতে পারে। উদাহরণস্বরূপ:
- স্প্যাম এবং নন-স্প্যাম ইমেইল শ্রেণি।
- পাস এবং ফেইল পরীক্ষার ফলাফল।
- হাঁ, না ভিত্তিক সিদ্ধান্ত।
প্রবাবিলিটি বের করা:
Logistic Regression মডেলটি Sigmoid Function ব্যবহার করে ইনপুট ভেরিয়েবলগুলির মাধ্যমে প্রবাবিলিটি নির্ধারণ করে। এটি 0 থেকে 1 এর মধ্যে একটি মান প্রদান করে, যা আউটপুট ক্লাসের প্রবাবিলিটি নির্দেশ করে। উদাহরণস্বরূপ, যদি মডেলটি 0.8 আউটপুট দেয়, তবে এটি 80% সম্ভাবনা দেখায় যে ইনপুটটি শ্রেণি 1 (যেমন, স্প্যাম) হবে, এবং 20% সম্ভাবনা যে এটি শ্রেণি 0 (যেমন, নন-স্প্যাম) হবে।
লিনিয়ার রিগ্রেশন এবং সিগময়েড:
লজিস্টিক রিগ্রেশন একটি লিনিয়ার রিগ্রেশন মডেল ব্যবহার করে এবং তারপরে আউটপুটটি সিগময়েড ফাংশনের মাধ্যমে রূপান্তরিত করে। সিগময়েড ফাংশন আউটপুটকে 0 থেকে 1 এর মধ্যে রূপান্তরিত করে, যা প্রবাবিলিটির মতো কাজ করে।
মডেল ফর্মুলা:
$P(y=1 | X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_n x_n)}}$
এখানে, $P(y=1 | X)$ হল আউটপুট শ্রেণির জন্য প্রবাবিলিটি, এবং $\beta_0, \beta_1, \ldots, \beta_n$ হল মডেলের কোফিসিয়েন্ট।
মডেল প্রশিক্ষণ:
Logistic Regression মডেলটি প্রশিক্ষণ দেওয়ার সময় ম্যাক্সিমাম লাইকেলিহুড এস্তিমেশন (Maximum Likelihood Estimation) পদ্ধতি ব্যবহার করে কোফিসিয়েন্টগুলির মান নির্ধারণ করে। এই পদ্ধতিতে, মডেলটি প্রশিক্ষণের ডেটা থেকে যথাযথ আউটপুট উৎপন্ন করার জন্য সর্বোত্তম কোফিসিয়েন্ট নির্বাচন করে।

Logistic Regression এর প্রধান উপাদানসমূহ

ইন্টারসেপ্ট (Intercept) এবং কোফিসিয়েন্ট (Coefficients):
- ইন্টারসেপ্ট ( $\beta_0$ ): মডেলের জন্য একটি স্থির মান, যা x এর মান শূন্য হলে আউটপুট প্রদর্শন করে।
- কোফিসিয়েন্ট ( $\beta_1, \beta_2, \ldots, \beta_n$ ): প্রতিটি স্বাধীন ভেরিয়েবলের প্রভাব নির্দেশ করে, এবং এটি মডেলকে ইনপুটের উপর ভিত্তি করে আউটপুট পূর্বাভাস করতে সহায়ক।
সিগময়েড ফাংশন:
আউটপুট 0 থেকে 1 এর মধ্যে রূপান্তরিত করার জন্য Sigmoid Function ব্যবহৃত হয়:
$\sigma(x) = \frac{1}{1 + e^{-x}}$
এটি ইনপুটের উপর ভিত্তি করে একটি প্রোবাবিলিটি দেয়, যা পরবর্তীতে সিদ্ধান্ত নেওয়ার জন্য ব্যবহৃত হয়।
লস ফাংশন (Loss Function): Logistic Regression-এ লজিস্টিক লস ফাংশন (Logistic Loss Function) ব্যবহৃত হয়, যা মডেলের পূর্বাভাস এবং প্রকৃত আউটপুটের মধ্যে পার্থক্য নির্ধারণ করে। এটি মডেলের প্রশিক্ষণের সময় সর্বনিম্ন করার চেষ্টা করা হয়।

Logistic Regression এর সুবিধা

সহজ এবং দ্রুত:
এটি একটি সহজ এবং দ্রুত বাস্তবায়নযোগ্য মডেল, যা মেশিন লার্নিংয়ে অল্প পরিমাণে ডেটা সহ কার্যকরী হতে পারে।
প্রবাবিলিটি প্রেডিকশন:
Logistic Regression একটি প্রোবাবিলিটি প্রদান করে, যা আউটপুট শ্রেণি (0 বা 1) নির্ধারণ করার জন্য খুবই সহায়ক।
ভাল ব্যাখ্যাযোগ্যতা:
এটি সহজে ব্যাখ্যা করা যায় এবং প্রশিক্ষিত মডেলের মাধ্যমে ইনপুট ফিচারের উপর প্রতিটি কোফিসিয়েন্টের প্রভাব বোঝা যায়।
বহু রৈখিক মডেল:
Logistic Regression খুব সহজেই Multiple Logistic Regression এ রূপান্তরিত হতে পারে, যেখানে একাধিক ইনপুট ভেরিয়েবল ব্যবহার করা হয়।

Logistic Regression এর সীমাবদ্ধতা

সীমিত ক্ষমতা:
এটি শুধুমাত্র বাইনারি ক্লাসিফিকেশন সমস্যার জন্য উপযুক্ত, যদিও এটি কনভার্সন বা মাল্টিনোমিয়াল লজিস্টিক রিগ্রেশন এর মাধ্যমে একাধিক শ্রেণির সমস্যার জন্য ব্যবহার করা যেতে পারে।
লাইনারিটি:
Logistic Regression এর জন্য ডেটার মধ্যে সম্পর্ক লাইনিয়ার হতে হবে, অর্থাৎ এটি লিনিয়ার রিগ্রেশন মডেলের মতো ইনপুট এবং আউটপুটের মধ্যে সম্পর্ক ধরে।
আউটলাইয়ার সংবেদনশীলতা:
Logistic Regression আউটলাইয়ারের প্রতি সংবেদনশীল হতে পারে, যা মডেলের পারফরম্যান্সকে প্রভাবিত করতে পারে।

সারাংশ

Logistic Regression একটি শক্তিশালী বাইনারি ক্লাসিফিকেশন মডেল যা দুটি শ্রেণির মধ্যে সম্পর্ক প্রতিষ্ঠা করে এবং একটি প্রবাবিলিটি তৈরি করে, যা আউটপুট শ্রেণি চিহ্নিত করতে ব্যবহৃত হয়। এটি মডেল তৈরির জন্য সহজ, ব্যাখ্যাযোগ্য এবং দ্রুত প্রশিক্ষণযোগ্য একটি মডেল, তবে কিছু সীমাবদ্ধতা যেমন লাইনারিটির উপর নির্ভরশীলতা এবং আউটলাইয়ার সংবেদনশীলতা রয়েছে।

Content added By

SATT Academy

Binary Classification এবং Sigmoid Function

197

Binary Classification (বাইনারি ক্লাসিফিকেশন)

Binary Classification একটি মেশিন লার্নিং সমস্যা যেখানে লক্ষ্য থাকে দুটি শ্রেণিতে ডেটা শ্রেণিবদ্ধ করা। এই ধরনের সমস্যা সাধারণত এমন পরিস্থিতিতে ব্যবহৃত হয় যেখানে আউটপুট দুটি সম্ভাব্য শ্রেণির মধ্যে একটি হবে, যেমন:

স্প্যাম এবং নন-স্প্যাম ইমেইল।
অ্যালার্ম এবং নন-অ্যালার্ম সিগন্যাল।
পাস এবং ফেইল ফলাফল।

এ ধরনের ক্লাসিফিকেশন মডেল একটি দ্বৈত শ্রেণি সমস্যা সমাধান করে এবং আউটপুট হিসেবে একটি বাইনারি ফলাফল প্রদান করে।

Binary Classification এর উদাহরণ:

ধরা যাক, আমাদের লক্ষ্য হলো একটি ইমেইলকে স্প্যাম বা নন-স্প্যাম শ্রেণিতে ভাগ করা। এখানে ইনপুট ডেটা (যেমন ইমেইলের বিষয়বস্তু, পাঠক) থাকবে এবং আউটপুট হবে দুটি শ্রেণির মধ্যে একটি: স্প্যাম অথবা নন-স্প্যাম।

লিনিয়ার মডেল:
বাইনারি ক্লাসিফিকেশন মডেলটি লিনিয়ার রিগ্রেশন বা লজিস্টিক রিগ্রেশন মডেল হতে পারে। তবে বাইনারি ক্লাসিফিকেশন মডেল ব্যবহারের সময়, আউটপুট সিগময়েড ফাংশনের মাধ্যমে দুটি ক্লাসে রূপান্তরিত হয়।

Sigmoid Function (সিগময়েড ফাংশন)

Sigmoid Function একটি ম্যাথমেটিক্যাল ফাংশন যা ইনপুট ভ্যালুকে একটি নির্দিষ্ট পরিসরে (0 এবং 1 এর মধ্যে) মান রূপান্তরিত করে। এই ফাংশনটি বিশেষভাবে বাইনারি ক্লাসিফিকেশন মডেলে ব্যবহৃত হয়, যেখানে আউটপুট দুইটি ক্লাসের মধ্যে একটি হতে হবে। সিগময়েড ফাংশন মূলত লজিস্টিক রিগ্রেশন মডেলে ব্যবহৃত হয়, যা বাইনারি ক্লাসিফিকেশনের জন্য একটি জনপ্রিয় মডেল।

Sigmoid Function এর ফর্মুলা:

$\sigma(x) = \frac{1}{1 + e^{-x}}$

যেখানে:

$\sigma(x)$ হল সিগময়েড ফাংশনের আউটপুট।
$x$ হল ইনপুট মান (মডেলের প্যারামিটার বা পূর্বাভাস)।
$e$ হল ন্যাচারাল লগারিদমের বেস (যা প্রায় 2.718)।

এই ফাংশনটি যে কোনো ইনপুট মান $x$ কে 0 এবং 1 এর মধ্যে মানে রূপান্তরিত করে, যা প্রবাবিলিটি (probability) হিসেবে ব্যবহার করা যায়। বাইনারি ক্লাসিফিকেশন মডেলে আউটপুটটি 0 বা 1 হবে, যেখানে 1 সাধারণত একটি শ্রেণির প্রতিনিধিত্ব করে এবং 0 অন্য শ্রেণির প্রতিনিধিত্ব করে।

Sigmoid Function এর ব্যবহার

Sigmoid Function মডেলকে আউটপুট হিসেবে দুটি শ্রেণির মধ্যে একটি নির্ধারণ করতে সাহায্য করে। এই ফাংশনটি ইনপুটের উপর ভিত্তি করে একটি প্রোবাবিলিটি নির্ধারণ করে এবং তারপরে সেই প্রোবাবিলিটিকে 0 বা 1 তে রূপান্তরিত করে।

উদাহরণ:

ধরা যাক, লজিস্টিক রিগ্রেশন মডেলটি একটি ইমেইলকে স্প্যাম বা নন-স্প্যাম শ্রেণিতে ভাগ করছে। মডেলটি একটি আউটপুট প্রদান করবে যা সিগময়েড ফাংশনের মাধ্যমে একটি প্রোবাবিলিটি হবে। উদাহরণস্বরূপ, সিগময়েড আউটপুট 0.8 হলে, এটি নির্দেশ করে যে মডেলটি 80% সম্ভাবনা নিয়ে সেই ইমেইলটি স্প্যাম শ্রেণির অন্তর্ভুক্ত মনে করছে, এবং 0.2 হলে 20% সম্ভাবনা।

import numpy as np
import matplotlib.pyplot as plt

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# x এর মানগুলি তৈরি
x = np.linspace(-10, 10, 100)

# সিগময়েড ফাংশনের মান বের করা
y = sigmoid(x)

# ফলাফল প্লট করা
plt.plot(x, y)
plt.title('Sigmoid Function')
plt.xlabel('x')
plt.ylabel('Sigmoid(x)')
plt.grid(True)
plt.show()

এটি একটি S-shaped curve তৈরি করবে, যেখানে ইনপুটের বৃদ্ধি সহ আউটপুট 0 থেকে 1 এর মধ্যে পরিবর্তিত হবে।

Sigmoid Function এর সুবিধা ও সীমাবদ্ধতা

সুবিধা:

প্রবাবিলিটি আউটপুট:
সিগময়েড ফাংশন বাইনারি ক্লাসিফিকেশন মডেলে প্রবাবিলিটি প্রদান করতে সহায়ক, যা সিদ্ধান্ত গ্রহণে সহায়ক হতে পারে।
নন-লিনিয়ারিটি:
সিগময়েডের সঞ্চালন আউটপুটটি কেবল 0 এবং 1 এর মধ্যে সীমাবদ্ধ থাকে, যা মডেলকে গুরুত্বপূর্ণ তথ্য সংগ্রহ করতে সহায়ক।

সীমাবদ্ধতা:

Vanishing Gradient Problem:
সিগময়েড ফাংশনটি বড় ইনপুটের জন্য খুব ছোট গ্র্যাডিয়েন্ট প্রদান করতে পারে, যা ব্যাকপ্রোপাগেশন সময় সমস্যা তৈরি করতে পারে।
আউটপুট সীমাবদ্ধতা:
সিগময়েডের আউটপুট সর্বদা 0 থেকে 1 এর মধ্যে থাকে, যার ফলে এটি শুধুমাত্র বাইনারি সিদ্ধান্তে ব্যবহৃত হতে পারে।

সারাংশ

Binary Classification হল একটি মেশিন লার্নিং সমস্যা যেখানে আউটপুট দুটি শ্রেণির মধ্যে একটি হতে হবে, যেমন স্প্যাম বা নন-স্প্যাম।
Sigmoid Function একটি নন-লিনিয়ার ফাংশন যা ইনপুট ভ্যালুকে 0 এবং 1 এর মধ্যে রূপান্তরিত করে, যা বাইনারি ক্লাসিফিকেশনে প্রবাবিলিটি হিসেবে ব্যবহৃত হয়।

Content added By

SATT Academy

Decision Boundary এবং Probabilistic Prediction

191

Decision Boundary এবং Probabilistic Prediction মেশিন লার্নিংয়ে ক্লাসিফিকেশন মডেলগুলোতে ব্যবহৃত দুটি গুরুত্বপূর্ণ ধারণা, যা মডেলগুলির আউটপুট বোঝাতে এবং তাদের প্রেডিকশন ক্ষমতা বিশ্লেষণ করতে সাহায্য করে। এই দুটি ধারণার ভূমিকা এবং কার্যকারিতা বিশদভাবে নিচে ব্যাখ্যা করা হলো।

1. Decision Boundary (ডিসিশন বাউন্ডারি)

Decision Boundary হলো সেই রেখা (বা হাইপারপ্লেন) যা ক্লাসিফিকেশন মডেল দুটি বা তার বেশি শ্রেণীর মধ্যে পার্থক্য তৈরি করে। এটি মডেলের দ্বারা তৈরি করা একটি সীমানা যা ইনপুট স্পেসে নির্ধারণ করে যে কোন ইনপুট কোন শ্রেণীতে পড়বে।

ব্যাখ্যা:

ডিসিশন বাউন্ডারি দুটি শ্রেণী (যেমন, "স্প্যাম" এবং "নন-স্প্যাম") বা আরও বেশি শ্রেণীকে পৃথক করে। এই বাউন্ডারি নির্ধারণ করে, যদি কোন ইনপুট পয়েন্ট একটি নির্দিষ্ট শ্রেণীতে পড়বে, তাহলে সেটি Decision Boundary এর এক পাশে থাকবে, এবং অন্য শ্রেণীতে পড়বে, তাহলে সেটি অন্য পাশে থাকবে।
বাউন্ডারি নির্ধারণ:
ক্লাসিফিকেশন মডেলগুলি (যেমন লজিস্টিক রিগ্রেশন, SVM, KNN) প্রেডিকশন করার সময়, একটি ডেটা পয়েন্ট কোন শ্রেণীতে পড়বে তা চিহ্নিত করতে Decision Boundary ব্যবহার করে। এই বাউন্ডারিটি সাধারণত ইনপুট ফিচারের উপর নির্ভর করে এবং এটি হাইপারপ্লেন হিসেবে দেখানো হয়।

উদাহরণ:

ধরা যাক, একটি ক্লাসিফিকেশন মডেল দুটি শ্রেণী "অ্যাপল" এবং "কমলা" চিহ্নিত করতে চেষ্টা করছে। যদি ফিচার 1 (যেমন, আয়তন) এবং ফিচার 2 (যেমন, রঙ) এর উপর ভিত্তি করে মডেলটি সিদ্ধান্ত নেয়, তবে একটি Decision Boundary হবে যে এটি ফিচারগুলির একটি নির্দিষ্ট সীমাতে অ্যাপল এবং কমলা আলাদা করবে।

যদি আমরা একটি 2D প্লটে ফলাফল দেখাই, যেখানে এক্স-অক্ষের উপর "আয়তন" এবং ওয়াই-অক্ষের উপর "রঙ" থাকে, তাহলে Decision Boundary একটি রেখা বা আয়তন-পৃষ্ঠ হিসেবে দেখা যাবে, যেখানে একপাশে "অ্যাপল" এবং অন্যপাশে "কমলা" থাকবে।

Decision Boundary উদাহরণ:

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.linear_model import LogisticRegression

# ডেটাসেট তৈরি
X, y = datasets.make_classification(n_samples=100, n_features=2, random_state=42)

# মডেল ট্রেনিং
model = LogisticRegression()
model.fit(X, y)

# Decision Boundary প্লট
xx, yy = np.meshgrid(np.arange(X[:, 0].min(), X[:, 0].max(), 0.1),
                     np.arange(X[:, 1].min(), X[:, 1].max(), 0.1))
Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contourf(xx, yy, Z, alpha=0.8)
plt.scatter(X[:, 0], X[:, 1], c=y, edgecolors='k', marker='o')
plt.show()

এই কোডে, Decision Boundary এর মাধ্যমে ডেটার মধ্যে স্পষ্ট সীমানা তৈরি করা হয় যেখানে দুটি শ্রেণী আলাদা হয়।

2. Probabilistic Prediction (প্রোবাবিলিস্টিক প্রেডিকশন)

Probabilistic Prediction হল একটি মডেল যা কেবল একটি শ্রেণী নির্ধারণ না করে, বরং প্রতিটি শ্রেণী হওয়ার সম্ভাবনা (probability) প্রদান করে। এর মাধ্যমে মডেলটি একটি নির্দিষ্ট ইনপুট পয়েন্টের জন্য যে শ্রেণীটি সবচেয়ে সম্ভাব্য, তা নয় বরং সম্ভাব্য সকল শ্রেণীর জন্য প্রেডিকশন দেয়।

ব্যাখ্যা:

লজিস্টিক রিগ্রেশন এবং Naive Bayes এর মতো মডেলগুলি প্রোবাবিলিস্টিক ক্লাসিফিকেশন প্রদান করে। এই মডেলগুলির মাধ্যমে, আপনি জানতে পারবেন একটি ডেটা পয়েন্টের কোন শ্রেণী হওয়ার সম্ভাবনা কত শতাংশ।
মডেল আউটপুট হিসেবে 0 থেকে 1 এর মধ্যে একটি সংখ্যা প্রদান করে, যা সেই শ্রেণীর হওয়ার সম্ভাবনা নির্দেশ করে।

উদাহরণ:

ধরা যাক, একটি মডেল একটি ইমেইল ক্লাসিফাই করতে চায় এবং ইমেইলটি স্প্যাম হতে পারে অথবা নন-স্প্যাম হতে পারে। মডেলটি বলে দিতে পারে:

Prob(স্প্যাম) = 0.85 (যেমন, 85% সম্ভাবনা স্প্যাম)
Prob(নন-স্প্যাম) = 0.15 (যেমন, 15% সম্ভাবনা নন-স্প্যাম)

এই আউটপুটের মাধ্যমে মডেলটি শুধু "স্প্যাম" বা "নন-স্প্যাম" সিদ্ধান্ত না নিয়ে, প্রতিটি শ্রেণীর সম্ভাবনা সম্পর্কে তথ্য দেয়।

Probabilistic Prediction উদাহরণ:

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification

# ডেটাসেট তৈরি
X, y = make_classification(n_samples=100, n_features=2, random_state=42)

# মডেল ট্রেনিং
model = LogisticRegression()
model.fit(X, y)

# প্রোবাবিলিস্টিক প্রেডিকশন
probabilities = model.predict_proba(X[:5])
print(probabilities)

এই কোডে, predict_proba() ফাংশনটি ইনপুট ডেটার জন্য প্রোবাবিলিস্টিক প্রেডিকশন প্রদান করে, যা প্রতিটি শ্রেণীর সম্ভাবনা বলে।

Decision Boundary এবং Probabilistic Prediction এর মধ্যে পার্থক্য

বৈশিষ্ট্য	Decision Boundary	Probabilistic Prediction
কাজ	ডেটাকে শ্রেণীভুক্ত করার জন্য সীমানা নির্ধারণ	প্রতিটি শ্রেণীর জন্য সম্ভাবনা প্রদান
আউটপুট	ডেটা পয়েন্ট কোন শ্রেণীতে পড়বে তা নির্ধারণ	প্রতিটি শ্রেণীর হওয়ার সম্ভাবনা (0 থেকে 1 এর মধ্যে)
ব্যবহার	ক্লাসিফিকেশন সমস্যা, সীমানা বুঝতে ব্যবহৃত	আরো তথ্যপূর্ণ ক্লাসিফিকেশন, যেমন সম্ভাবনার ধারণা
উদাহরণ	একটি স্প্যাম বা নন-স্প্যাম সীমানা নির্ধারণ	85% স্প্যাম এবং 15% নন-স্প্যাম হওয়ার সম্ভাবনা

সারাংশ

Decision Boundary হল সেই সীমানা যা ক্লাসিফিকেশন মডেল একটি ডেটা পয়েন্ট কোন শ্রেণীতে পড়বে তা নির্ধারণ করে।
Probabilistic Prediction ক্লাসিফিকেশন মডেলগুলির মাধ্যমে প্রতিটি শ্রেণীর জন্য সম্ভাবনা প্রদান করা হয়, যা মডেলটিকে শুধু শ্রেণী নির্ধারণ করতে সাহায্য না করে, বরং শ্রেণী হওয়ার সম্ভাবনা সম্পর্কে আরও গভীর ধারণা দেয়।

Content added By

SATT Academy

Model Evaluation (Confusion Matrix, ROC-AUC Curve)

225

মডেল ইভ্যালুয়েশন মেশিন লার্নিংয়ের একটি গুরুত্বপূর্ণ অংশ, যা মডেলের কার্যকারিতা বা পারফরম্যান্স মূল্যায়ন করতে ব্যবহৃত হয়। Confusion Matrix এবং ROC-AUC Curve হল দুটি জনপ্রিয় মেট্রিক্স যা ক্লাসিফিকেশন মডেলগুলির পারফরম্যান্স মূল্যায়ন করতে ব্যবহৃত হয়। এগুলি বিশেষভাবে বাইনারি ক্লাসিফিকেশন মডেলগুলির জন্য খুবই কার্যকরী। আসুন, এগুলির বিশদ আলোচনা করি।

১. Confusion Matrix (কনফিউশন ম্যাট্রিক্স)

Confusion Matrix হলো একটি টেবিল যা ক্লাসিফিকেশন মডেলের পারফরম্যান্স পরিমাপ করার জন্য ব্যবহৃত হয়। এটি মূলত সঠিক এবং ভুল পূর্বাভাসের সংখ্যা (ট্রু পজিটিভ, ট্রু নেগেটিভ, ফালস পজিটিভ, ফালস নেগেটিভ) প্রদর্শন করে, যা মডেলটির কার্যকারিতা বোঝাতে সাহায্য করে।

Confusion Matrix এর উপাদানসমূহ:

True Positive (TP): মডেল সঠিকভাবে পজিটিভ ক্লাস পূর্বাভাস করেছে।
True Negative (TN): মডেল সঠিকভাবে নেগেটিভ ক্লাস পূর্বাভাস করেছে।
False Positive (FP): মডেল ভুলভাবে পজিটিভ ক্লাস পূর্বাভাস করেছে (Type I Error)।
False Negative (FN): মডেল ভুলভাবে নেগেটিভ ক্লাস পূর্বাভাস করেছে (Type II Error)।

Confusion Matrix Example:

ধরা যাক, একটি মডেল ইমেইল স্প্যাম ডিটেক্ট করার জন্য প্রশিক্ষিত এবং এটি দুটি শ্রেণীতে (স্প্যাম এবং নন-স্প্যাম) ভাগ করেছে।

	Predicted Spam	Predicted Not Spam
Actual Spam	TP = 50	FN = 10
Actual Not Spam	FP = 5	TN = 100

এখানে:

TP (True Positive): 50 স্প্যাম ইমেইল সঠিকভাবে স্প্যাম হিসেবে চিহ্নিত হয়েছে।
TN (True Negative): 100 নন-স্প্যাম ইমেইল সঠিকভাবে নন-স্প্যাম হিসেবে চিহ্নিত হয়েছে।
FP (False Positive): 5 নন-স্প্যাম ইমেইল ভুলভাবে স্প্যাম হিসেবে চিহ্নিত হয়েছে।
FN (False Negative): 10 স্প্যাম ইমেইল ভুলভাবে নন-স্প্যাম হিসেবে চিহ্নিত হয়েছে।

Confusion Matrix ব্যবহার:

Confusion Matrix থেকে আমরা অনেক গুরুত্বপূর্ণ মেট্রিক্স বের করতে পারি, যেমন:

Accuracy = $\frac{TP + TN}{TP + TN + FP + FN}$
Precision = $\frac{TP}{TP + FP}$
Recall (Sensitivity) = $\frac{TP}{TP + FN}$
F1-Score = $2 \times \frac{Precision \times Recall}{Precision + Recall}$

উদাহরণ কোড:

from sklearn.metrics import confusion_matrix
y_true = [1, 0, 1, 1, 0, 0, 1]
y_pred = [1, 0, 1, 0, 0, 1, 1]
cm = confusion_matrix(y_true, y_pred)
print(cm)

সারাংশ:

Confusion Matrix হল একটি শক্তিশালী টুল যা মডেলের ভুল এবং সঠিক পূর্বাভাসগুলি বিশ্লেষণ করতে সাহায্য করে এবং মডেল পারফরম্যান্সের অন্যান্য মেট্রিক্স বের করতে সহায়ক।

২. ROC Curve এবং AUC (Area Under the Curve)

ROC Curve (Receiver Operating Characteristic Curve) একটি গ্রাফিক্যাল রিপ্রেজেন্টেশন যা মডেলের পারফরম্যান্স নির্ধারণ করে, বিশেষভাবে বাইনারি ক্লাসিফিকেশন মডেলগুলির জন্য। এটি মডেলের True Positive Rate (TPR) এবং False Positive Rate (FPR) এর মধ্যে সম্পর্ক দেখায়।

ROC Curve এর উপাদান:

True Positive Rate (TPR) বা Recall: $\frac{TP}{TP + FN}$
False Positive Rate (FPR): $\frac{FP}{FP + TN}$

ROC Curve গ্রাফের মধ্যে, TPR Y-অক্ষ (Vertical) এবং FPR X-অক্ষ (Horizontal) এ প্লট করা হয়।

AUC (Area Under the Curve):

AUC বা Area Under the Curve হল ROC Curve-এর নিচে যে এলাকা আছে, তার আয়তন। এটি মডেলের পারফরম্যান্সের এক ধরনের সংক্ষিপ্ত পরিমাপ। AUC এর মান 0 থেকে 1 এর মধ্যে থাকে:

AUC = 1: মডেলটি পূর্ণ পারফরম্যান্স দেখাচ্ছে, সঠিকভাবে সবকিছু পূর্বাভাস করছে।
AUC = 0.5: মডেলটি কেবল অনুমান করছে, কোনো পারফরম্যান্স নেই।
AUC < 0.5: মডেলটি খারাপ কাজ করছে, এমনকি এলোমেলো পূর্বাভাসের চেয়েও খারাপ।

ROC Curve এবং AUC Example:

from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt

y_true = [0, 0, 1, 1]  # আসল টার্গেট
y_scores = [0.1, 0.4, 0.35, 0.8]  # মডেলের স্কোর

fpr, tpr, thresholds = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)

# ROC Curve Plot
plt.plot(fpr, tpr, color='blue', lw=2, label=f'AUC = {roc_auc:.2f}')
plt.plot([0, 1], [0, 1], color='gray', linestyle='--')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic (ROC) Curve')
plt.legend(loc="lower right")
plt.show()

সারাংশ:

ROC Curve: মডেলের পারফরম্যান্স দেখানোর জন্য একটি গ্রাফিক্যাল রিপ্রেজেন্টেশন যা True Positive Rate (TPR) এবং False Positive Rate (FPR) এর সম্পর্ক প্রদর্শন করে।
AUC: এটি ROC Curve-এর নিচের এলাকার পরিমাপ, যা মডেলের পারফরম্যান্সের একটি সংক্ষিপ্ত পরিমাপ প্রদান করে।

Confusion Matrix এবং ROC-AUC Curve এর মধ্যে পার্থক্য

বৈশিষ্ট্য	Confusion Matrix	ROC-AUC Curve
ব্যবহার	সঠিক এবং ভুল পূর্বাভাসের সংখ্যা পরিমাপ করতে	মডেলের পারফরম্যান্স দেখানোর জন্য গ্রাফিক্যাল রিপ্রেজেন্টেশন
মেট্রিক্স	Accuracy, Precision, Recall, F1-Score	True Positive Rate (TPR), False Positive Rate (FPR)
পারফরম্যান্স	কনফিউশন ম্যাট্রিক্সের সাহায্যে মডেল পারফরম্যান্স বিশ্লেষণ	AUC (Area Under Curve) দ্বারা মডেল পারফরম্যান্স পরিমাপ
ব্যবহারযোগ্যতা	ছোট ডেটাসেট এবং বাইনারি/মাল্টিক্লাস ক্লাসিফিকেশন	বিশেষভাবে বাইনারি ক্লাসিফিকেশন মডেলগুলির জন্য

সারাংশ

Confusion Matrix মডেলের সঠিক এবং ভুল পূর্বাভাস বিশ্লেষণ করার জন্য ব্যবহৃত হয় এবং বিভিন্ন মেট্রিক্স (যেমন Precision, Recall, F1-Score) বের করতে সাহায্য করে।
ROC Curve এবং AUC মডেলের পারফরম্যান্সের একটি গ্রাফিক্যাল রিপ্রেজেন্টেশন সরবরাহ করে এবং AUC মানের মাধ্যমে মডেলটি কতটা কার্যকর তা পরিমাপ করা হয়।

এই দুটি মেট্রিক্স মডেল ইভ্যালুয়েশন এবং মডেল নির্বাচন প্রক্রিয়ায় গুরুত্বপূর্ণ ভূমিকা পালন করে।

Content added By

SATT Academy

Scikit-Learn পরিচিতি Scikit-Learn ইনস্টলেশন এবং সেটআপ Scikit-Learn এর মৌলিক ধারণা Data Preprocessing Train-Test Split এবং Cross-Validation

Logistic Regression

Logistic Regression এর মৌলিক ধারণা

Logistic Regression মডেল ট্রেনিং

লস ফাংশন:

Logistic Regression এর উদাহরণ

কোড উদাহরণ:

Logistic Regression এর উপকারিতা:

Logistic Regression এর সীমাবদ্ধতা:

সারাংশ

Logistic Regression এর ভূমিকা

Logistic Regression এর ভূমিকা এবং ব্যবহার

Logistic Regression এর প্রধান উপাদানসমূহ

Logistic Regression এর সুবিধা

Logistic Regression এর সীমাবদ্ধতা

সারাংশ

Binary Classification এবং Sigmoid Function

Binary Classification (বাইনারি ক্লাসিফিকেশন)

Binary Classification এর উদাহরণ:

Sigmoid Function (সিগময়েড ফাংশন)

Sigmoid Function এর ফর্মুলা:

Sigmoid Function এর ব্যবহার

উদাহরণ:

Sigmoid Function এর সুবিধা ও সীমাবদ্ধতা

সুবিধা:

সীমাবদ্ধতা:

সারাংশ

Decision Boundary এবং Probabilistic Prediction

1. Decision Boundary (ডিসিশন বাউন্ডারি)

ব্যাখ্যা:

উদাহরণ:

Decision Boundary উদাহরণ:

2. Probabilistic Prediction (প্রোবাবিলিস্টিক প্রেডিকশন)

ব্যাখ্যা:

উদাহরণ:

Probabilistic Prediction উদাহরণ:

Decision Boundary এবং Probabilistic Prediction এর মধ্যে পার্থক্য

সারাংশ

Model Evaluation (Confusion Matrix, ROC-AUC Curve)

১. Confusion Matrix (কনফিউশন ম্যাট্রিক্স)

Confusion Matrix এর উপাদানসমূহ:

Confusion Matrix Example:

Confusion Matrix ব্যবহার:

সারাংশ:

২. ROC Curve এবং AUC (Area Under the Curve)

ROC Curve এর উপাদান:

AUC (Area Under the Curve):

ROC Curve এবং AUC Example:

সারাংশ:

Confusion Matrix এবং ROC-AUC Curve এর মধ্যে পার্থক্য

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!